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基于 激光 雷达 数据 的 行人 检测 
任 科 飞 ， 张 利 


(清华 大 学 电子 工程 系 ,北京 100084) 


摘 要 : 在 自动 驾驶 领域 涉及 的 众多 任务 中 ， 行 人 识别 是 必须 可 少 的 技术 之 一 。 针 对 基于 图 像 数 据 的 行人 检测 算法 
无 法 获得 行人 深度 的 问题 ， 提 出 了 基于 激光 雷达 数据 的 行人 检测 算法 。 该 算法 结合 传统 的 基于 激光 雷达 数据 的 运动 
目标 识别 算法 和 基于 深度 学 习 的 点 云 识 别 算 法 ， 可 以 在 不 依赖 图 像 数据 的 条 件 下 感知 和 检测 行人 ， 进 而 获取 行人 的 
准确 三 维 位 置 , 辅助 自动 驾驶 的 控制 系统 作出 合理 决策 。 该 算法 在 KITTI 三 维 目标 检测 任务 数据 集 上 进行 性 能 测试 ， 
在 中 等 难度 测试 达到 33.37% 的 平均 准确 度 , 其 表现 领先 于 其 他 的 基于 激光 雷达 的 算法 , 充分 证 明了 该 方法 的 有 效 性 。 
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Pedestrian detection based on LiDAR data 


Ren Kefei, Zhang Li 
(Dept. of Electronic Engineering, Tsinghua University, Beijing 100084, China) 


Abstract: Pedestrian detection is a task which is necessary among all tasks leveraged in automatic driving domain. 
Traditional pedestrian detection algorithms took fully advantage of image data, unable to obtain depth of objects. To address 
aforementioned issue, this paper proposed a method based on raw LiDAR point cloud data. The proposed method combines 
traditional moving object detection in LIDAR data and point cloud recognition by deep learning, and is capable of 
perception and pedestrian detection without images, obtaining 3d location of pedestrian, therefore helping central control 
system make reasonable decisions. This method experimented in 3d object detection task of KITTI dataset, obtained 33.3796 
AP (Average Precision) on moderate cases. The results showed that proposed method performed better than other algorithm 
based on LiDAR data, which hence indicated the effectiveness of proposed method. 
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0 引言 非常 优异 的 表现 ， 然 而 ， 将 Faster-RCNN 模型 直接 用 于 行人 
5 检测 任务 效果 并 不 令 人 满意 ， 主 要 原因 在 于 大 多 数 场 景 下 行 

行人 检测 需要 解决 的 问题 是 在 复杂 的 背景 中 定位 行人 ， 人 属于 小 目标 ， 多 层 的 卷 积 操作 会 造成 目标 的 丢失 ， 最 终 出 

并 用 和 矩形 框 或 立方 体 框 标志 其 位 置 ， 因 此 行人 检测 属于 目标 现 大 量 漏 检 情况 。Zhang 等 人 外 提出 增加 语义 信息 以 及 深度 
伶 测 的 范畴 。 行 人 检测 任务 一 直 是 计算 机 视觉 领域 中 的 热门 HUN Faster-RCNN 进行 改进 ， 提 高 了 Faster-RCNN 模型 的 
问题 和 难点 问题 ， 在 不 同 任务 中 都 广泛 应 用 ， 在 自动 驾驶 领 针对 性 ， 从 而 减少 了 漏 检 。 基 于 图 像 的 行人 检测 算法 能 够 充 
域 中 更 是 至 关 重 要 。 自 动 芍 驶 技术 需要 通过 传感器 感知 周转 分 运用 图 像 特征 ， 在 图 像 上 定位 行人 的 位 置 ， 然 而 无 法 获取 
环境 ， 并 识别 环境 中 的 重要 目标 ， 如 行人 和 车辆 等 ， 获 取 位 行人 的 深度 信息 ， 虽 然 一 些 工作 尝试 通过 深度 神经 网 络 估计 
置 、 深 度 、 速 度 及 运动 轨迹 等 重要 信息 ， 辅 助 中 央 控 制 系统 目标 的 深度 1， 然而 精度 并 不 高 。 
作出 合理 决策 。 深 度 信息 表示 目标 到 传感器 的 距离 ， 是 获取 随 着 激光 雷达 的 广泛 应 用 ， 可 以 在 室外 场景 下 精确 的 获 
维 位 置 、 速 度 等 信息 的 基础 。 研 究 自动 驾驶 场景 下 的 行人 取 环 境 的 深度 信息 .激光 雷达 通过 激光 脉冲 对 环境 进行 采样 ， 
检测 能 够 帮助 系统 作出 更 合理 的 决策 ， 并 避免 交通 事故 和 人 获取 环境 到 传感器 的 距离 ， 受 天 气 情况 及 光照 条 件 的 影响 较 
员 伤亡 ， 因 此 重要 性 也 不 言 而 喻 。 小 。 激 光 雷 达 获 取 数 据 形式 为 点 云 数 据 ， 具 有 无 序 性 、 稀 下 C 
传统 的 行人 检测 算法 主要 利用 图 像 数据 ， 由 于 应 用 场景 性 以 及 特征 少 的 特点 ， 直 接 将 在 图 像 检 测 领 域 非常 成 功 的 卷 
通常 为 室外 ， 光 照 条 件 和 天 气 情况 会 极 大 的 影响 图 像 质 量 ， 积 神经 网 络 推广 作为 点 云 的 处 理工 具 并 不 能 取得 非常 好 的 效 
进而 也 会 影响 行人 检测 算法 的 精确 度 。Dalal 等 人 由 提出 基于 Re Asvadi 等 人 名 提出 的 运动 目标 检测 算法 将 点 云 数 据 转换 
HOG(histogram of gradienb) 特 征 和 支持 向 量 机 (support vector 为 体 素 ， 每 个 体 素 的 值 为 0 或 1， 代 表 体 素 中 是 否 含有 点 云 
machine,SVM ) 的 行人 检测 算法 , 利用 HOG 特征 提供 的 边缘 数据 ， 随 后 ， 通 过 在 时 间 维 度 上 的 体 素 的 累积 判断 目标 是 否 
信息 及 梯度 强度 信息 提供 行人 候选 区 域 ， 结 合 SVM 分 类 器 为 运动 物体 。Maturana 等 人 外 提出 了 VoxNet， 将 点 云 数 据 转 
进行 分 类 。 然 而 SVM 分 类 器 的 计算 复杂 度 非常 大 ， 与 支持 换 为 体 素 形 式 ， 进 而 将 卷 积 神 经 网 络 扩展 为 三 维 卷 积 神经 网 
向 量 的 数量 成 正比 。Jones 等 人 中 提出 利用 AdaBoost 算法 代 络 对 点 云 进行 处 理 。 然 而 由 于 点 云 的 稀疏 性 ， 转 换 为 体 素 形 
BR SVM， 提 高 了 计算 速度 。RCNN 系列 算法 S41 通过 卷 积 神 式 后 会 出 现 大 量 零 值 ， 对 识别 任务 毫 无 贡献 ， 三 维 卷 积 也 会 
经 网 络 实现 端 到 端 多 目标 检测 模型 ， 在 目标 检测 领域 取得 了 对 计算 资源 大 量 消耗 。Qi 等 人 提出 的 PointNet'?! 和 
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PointNet++I 是 对 点 云 分 类 算法 的 突破 性 创新 。PointNet 首 
次 直接 对 无 序 的 点 云 数 据 进行 处 理 ， 通 过 多 层 感 知 机 提取 点 
云 全 局 特征 进行 分 类 ; PointNet++ 是 对 PointNet 工作 的 改进 ， 
增加 了 层级 的 点 云 区 域 特征 提取 子 网 络 (set abstraction net), 
提高 了 分 类 的 精确 率 。 然 而 ， 上 述 的 点 云 分 类 只 能 应 用 于 较 
小 的 场景 ， 对 于 自动 驾驶 场景 中 大 场景 的 点 云 数 据 并 不 能 得 
到 很 好 的 结果 。Qi 等 人 02 提 出 利用 图 像 二 维 检测 器 检测 
标 ， 将 PointNet 的 应 用 范围 限制 在 二 维 矩 形 框 反 投影 得 到 的 
视 锥 内 ， 级 联 PointNet 网 络 进行 二 元 点 云 分 割 ， 将 点 云 分 为 
目标 和 非 目 标点 云 ， 最 后 利用 目标 点 云 进行 位 置 回 归 。 文 献 
[12] 的 缺点 在 于 仍然 依赖 图 像 检 测 器 ， 最 后 的 检测 结果 受 限 
于 图 像 检测 器 的 结果 ， 也 没有 解决 由 于 光照 及 恶劣 天 气 带 来 
的 检测 精度 下 降 的 问题 。BirdNett3 和 TopNet04 为 不 依赖 图 
像 数 据 的 车 辆 检测 方法 。 这 两 种 方法 均 通 过 对 地 面 的 估计 ， 
将 点 云 映 射 到 地 面 ， 将 人 为 设计 的 信息 转换 为 鸟 晤 图 数据 ， 
并 利用 Faster-RCNN 网 络 对 目标 进行 检测 与 识别 。 
本 文 提 出 的 基于 激光 雷达 的 行人 检测 算法 ， 能 在 不 依赖 
图 像 数 据 的 情况 对 点 云 数据 进行 处 理 ， 检 测 目 标 ， 获 取 目 标 
的 类 别 及 位 置信 息 。 本 文 提出 的 算法 拥有 三 个 创新 点 : 

a) 提 出 了 结合 了 传统 激光 雷达 目标 检测 算法 与 点 云 分 类 
算法 的 行人 检测 算法 ; 

b) 提 出 了 密度 自 适应 的 地 面 估计 方法 ， 能 够 根据 点 云 密 
度 自 适应 地 调整 估计 算法 的 应 用 范围 ; 
co) 提出 了 调整 点 云 数据 密度 算法 ， 对 点 云 数 据 进行 预 处 
理 ， 使 其 更 适应 传统 的 聚 类 算法 。 
1 ”地 面 去 除 
本 文 认 为 ， 需 要 检测 的 目标 〈 行 人、 车 辆 、 树 木 、 建 筑 
等 ) 均 位 于 地 面 之 上 ， 目 标点 云 通过 地 面相 互 连 接 ， 因 此 移 


看 点 云 后 ， 目 标点 云 将 相互 分 离 55259， 进 而 可 以 利用 缘 
类 算法 即 可 获得 行人 候选 聚 类 。 传 统 的 地 面 去 除 方法 0 将 


— 


任 科 飞 ， 等 : 基于 激光 雷 


同 切 
中 最 
适合 


达 数 据 的 行人 检测 


ChinaXiv 合 作 期 刊 

第 37 卷 第 4 其 
片 的 点 云 数据 , 黑色 点 表示 被 认为 是 噪声 的 点 云 ,图 1(a) 
外 层 绿色 的 点 云 距离 传感器 最 远 ， 含 有 大 量 的 噪声 ， 不 
估计 地 面 ， 然 而 在 文献 [8 中 仍然 会 在 后 续 过 程 中 估计 地 
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在 图 1b) 中 ， 最 外 层 点 云 由 于 点 云 元 素数 量 小 于 阔 值 
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(a) 文 献 [6] 中 的 切片 算法 结果 (b) 本 文 提 
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。 这 样 做 不 仅 能 减少 后 续 处 理 点 云 数量 ， 


Thresh ， 因 此 被 当 作 噪声 处 理 。 可 以 看 出 ， 本 文 提 出 的 密度 


应 切片 算法 可 以 更 
算法 的 效率 。 


了 效 的 利用 点 云 数 据 ， 提 升 了 文献 [8] 


出 的 密度 自 适 应 的 切片 结 
(a)slicing result of paper [6] (b)depicts proposed adaptive slicing result 
图 1 两 种 切片 结果 比较 
Fig.1 Comparing results of two slicing approach 

门限 与 拟 合 地 面 

对 于 每 个 切片 中 的 点 云 数 据 , 本 文 利用 四 分 法 确定 门限 。 
利用 切片 中 点 云 高 度 的 中 位 数 8@ ， 将 点 云 分 为 上 下 两 部 
随后 ， 分 别 确定 上 下 两 部 分 点 云 高 度 的 中 位 数 2 和 O, ; 
， 本 文 把 高 度 大 于 2 且 小 于 2 的 点 作为 拟 合 地 面 的 内 
减少 处 理 时 间 ， 
可 以 去 除 大 部 分 噪声 ， 提 升 算法 效率 及 精度 。 然 后 ， 本 
用 RANSAC 方法 09 在 每 一 个 切片 中 通过 内 点 拟 合 地 面 
o RANSAC 是 一 种 通过 和 友 代 寻找 最 优 模型 的 拟 合算 法 ， 


达 本 身 的 运动 会 对 数据 获取 造成 影响 ， 通 常情 况 下 点 云 数 据 “对 于 含有 较 多 噪声 的 数据 , RANSAC 比 直接 最 小 二 乘 算法 更 
的 路 面 并 不 符合 固定 的 曲面 模型 。 文 献 [8] 中 将 根据 距离 将 。 加 和 鲁 棒 。 最 后 通过 文献 [8] 提 出 的 验证 方法 验证 每 个 切片 的 地 
点 云 数 据 分 为 多 个 部 分 并 分 别处 理 ， 构 建 不 同 的 平面 模型 去 面 模型 。 
除 路 面 。 然 而 ， 文 献 [8] 中 的 方法 采取 固定 的 距离 区 间 ， 当 传 2 RX 
感 器 的 有 效 感知 区 间 远 小 于 设 定 的 区 间 时 《〈 如 建筑 物 遮 挡 
时 ), 在 某 些 区 间 会 出 现 全 部 是 噪声 或 者 不 含有 路 面 点 云 的 情 聚 类 算法 作为 非 监 督学 习 算法 已 经 被 非常 广泛 的 应 用 于 
况 ， 通 过 这 些 区 间 的 点 云 估计 地 面 是 无 意义 的 。 因 此 本 文 提 ”数据 挖掘 ,图 像 处 理 以 及 模式 识别 等 领域 。 DBSCAN 算法 P0 
出 了 密度 适应 的 地 面 去 除 算法 。 是 一 种 鲁 棒 的 基于 密度 的 聚 类 算法 ， 相 对 于 其 他 聚 类 算法 的 
11 密度 自 适应 点 云 切 片 优势 在 于 DBSCAN 不 需要 预先 确定 数据 中 的 目标 数目 。 
激光 雷达 感知 得 到 的 点 云 数据 具有 密度 不 均匀 的 属性 ， DBSCAN 算法 的 聚 类 半径 以 及 聚 类 中 最 小 元 素 个 数 是 全 局 
昌 距 离 传感器 的 距离 越 远 ， 点 云 数据 的 密度 越 低 ， 且 噪声 越 确定 的 ， 因 此 通常 适用 于 密度 均匀 的 数据 ， 当 应 用 于 密 
多 。 因 此 ， 将 点 去 数据 按照 距离 分 为 不 同 的 部 分 ， 由 于 靠近 ” 度 不 均匀 的 数据 ， 如 激光 雷达 数据 时 ， 则 聚 类 效果 比较 差 。 
传感器 最 近 的 部 分 数据 密度 最 高 ， 利 用 这 一 部 分 拟 合 的 地 面 ”因此 ， 笔 者 提出 通过 对 点 云 数 据 的 预 处 理 ， 对 其 密度 进行 变 
平面 模型 也 最 可 靠 。 密 度 自 适应 点 云 切片 的 流程 如 下 : 换 ， 使 其 在 高 度 维度 上 密度 均衡 ， 再 利用 DBSCAN 进行 聚 
a) 确定 切片 的 最 近 距 离 与 最 远 距 离 ; 类 处 理 ， 可 以 提高 聚 类 的 准确 度 。 
b) 确定 间隔 参数 六 ， 并 确定 切片 间隔 及 个 数 N ; 2.1 TRAE 


c) 判断 切片 中 是 否 含有 足够 多 的 点 云 数据 , 即 点 云 元 素 
HEERA FE Thresh, WRF Thresh ， 则 与 下 一 个 切 男 
合并 ， 重 复 此 过 程 N 次 ; 

d) 判断 最 后 一 个 切片 是 否 含有 足够 多 的 点 去 数据 , 如果 
元 素数 量 小 于 Thresh ， 则 将 此 切片 看 做 噪声 丢弃 。 
图 1 展示 的 是 文献 [8] 中 的 切片 算法 与 本 文 提出 的 密度 自 
适应 切片 算法 结果 的 比较 ， 图 1 中 , (a) 为 文献 [8] 的 结果 ;(b) 
为 本 文 密度 自 适 应 切片 算法 的 结果 ， 不 同 的 颜色 表示 属于 不 
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激光 雷达 的 扫描 线 通常 以 固定 的 垂直 角度 间隔 分 布 ， 因 
然 造成 距离 传感器 近 的 数据 密度 高 ， 而 距离 传感器 远 的 
密度 低 的 情况 。 图 2 所 示 的 为 激光 雷达 的 扫描 线 模型 ， 
z=0 表 示 激 光 雷 达 传 感 器 所 在 的 平面 (通常 安装 在 载 具 
蓝 色 虚线 为 激光 雷达 发 出 的 扫描 线 ，4 为 点 云 数据 到 
器 的 最 小 距离 ， Ac 为 相 邻 扫描 线 的 间隔 角度 。 假 设 在 
传感器 省 处 存在 一 个 点 〈 图 2 中 红色 点 )， 本 文 提出 利 
下 方法 调整 点 云 的 高 度 维度 。 
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首先 根据 相似 三 角形 原理 可 以 得 到 式 (1)。 


h i 
h d (1) 
hr ch 


化 简 后 可 得 到 式 (2)。 

e td, Q) 

其 中 : A 为 此 点 的 原始 高 度 坐 标 ，W”* 为 调整 后 的 高 度 坐 标 。 
图 3(c) 为 密度 调整 后 的 点 云 数据 ， 可 以 看 出 ， 点 云 数据 
只 有 在 高 度 维 度 上 的 密度 放生 了 变化 ， 这 样 不 仅 可 以 更 适合 
聚 类 算法 应 用 ， 而 且 能 够 保留 点 云 数据 中 的 几何 特征 。 


plane ground 


Rİ 


2 激光 雷达 扫描 线 模型 
Fig.2 LiDAR scan model 
2.2 DBSCAN 聚 类 

DBSCAN 算法 需要 两 个 全 局 参数 : eps 和 MinPts， 分 别 
表示 聚 类 半径 和 聚 类 的 最 小 对 象 数量 。 如 果 两 点 的 距离 大 于 
eps， 则 两 点 被 认为 不 属于 同一 个 聚 类 。 如 果 聚 类 中 的 点 数量 
小 于 MinPts， 那 么 此 聚 类 被 当 作品 声 。 本 文 在 实验 中 发 现 当 
eps 设 为 0.13, MinPts 设 为 5 时 可 以 得 到 最 好 的 聚 类 效果 。 
图 3 为 点 云 数据 在 上 述 一 系列 操作 中 的 结果 。 图 中 ，(a) 为 原 
始 的 点 云 数 据 ， 红 色 边 界 框 内 为 行人 ， 点 云 的 颜色 根据 点 云 
度 坐 标 分 配 ， 蓝 色 为 高 度 坐标 较 低 的 点 ， 黄 色 为 高 度 坐 标 
较 高 的 点 ; (b) 为 地 面 去 除 后 的 剩余 点 云 数 据 ; (c) 为 经 过 密度 
调整 后 的 点 云 ; (d) 为 DBSCAN 聚 类 的 结果 ， 相 邻 聚 类 以 不 
同 颜 色 表示 ， 黑 色 代 表 被 认为 是 噪声 的 点 ， 可 以 看 出 红色 边 
界 框 内 的 行人 显示 为 绿色 ， 说 明 被 当做 行人 候选 聚 类 ， 另 外 
大 量 背景 也 被 认为 是 候选 聚 类 ， 因 此 需要 对 候选 聚 类 进行 得 
选 。 


zi 


: E 
i ka Was 
» y. ` Sh 3 DUI 


(a) 原 始点 云 数据 (位 于 摄像 
机 FOV 内 部 分 ) 


(a)raw point cloud data (b)remaining point cloud after removing 


(b) 去 除 地 面 后 的 剩余 点 云 


plane(only in FOV of camera) 
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(0) 调 整 密度 后 的 点 云 (d) 聚 类 操作 得 到 的 点 云 聚 类 
(c)point cloud after density adapt process (d) represents cluster result 
图 3 点 云 操作 结果 (不 同 颜色 代表 不 同 聚 类 ,黑色 为 噪声 ) 


Fig.3 Results of a serial of point cloud processing(different color 


points belong to different clusters, and black points is deemed as noise) 
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2.3 筛选 
根据 行人 的 先 验 知识 ， 可 以 对 得 到 的 点 云 聚 类 进行 筛选 
以 去 除 大 部 分 背景 聚 类 。 这 样 不 仅 可 以 降低 后 续 的 计算 复杂 
E, 又 可 以 去 除 大 量 的 负 样 本 , 减少 正 负 样本 的 不 平衡 程度 。 
根据 候选 聚 类 的 长 度 O, WE (w) 及 最 大 高 度 Ch， 候 选 
聚 类 中 高 度 最 高 的 点 距离 地 面 的 高 度 ), 本 文通 过 以 下 规则 得 
选 候选 聚 类 ， 符 合 如 下 条 件 GR (3) ~ (6 的 被 认为 是 行 
人 候选 聚 类 ， 否 则 被 认为 是 噪声 。 


0.01<7<1.0 (3) 
0.01<w<1.0 (4) 
0.5<h<2 (5) 
JP xw: >0.1 (6) 
3 聚 类 识别 网 络 
本 文 改 进 了 文献 [12] 中 的 点 云 分 割 网 络 及 回归 网 络 作为 


识别 网 络 。 文 献 [12] 中 分 割 网 络 与 回归 网 络 级 联 ， 分 割 网 络 
的 输入 为 由 二 维 检测 结果 限定 的 视 锥 内 的 一 部 分 点 云 数据 ， 
输出 为 目标 点 云 ， 回 归 网 络 的 输入 为 目标 点 云 ， 输 出 为 边界 
框 的 参数 。 本 文 将 分 类 网 络 和 回归 网 络 并 联 ， 输 入 均 为 行人 
候选 聚 类 ， 利 用 PointNet++ 网 络 作为 特征 提取 网 络 ,通过 set 
abstraction net 进行 层级 的 局 部 特征 提取 ， 最 后 得 到 点 云 全 局 
特征 向 量 ， 接 着 利用 全 连接 网 络 输出 最 后 的 结果 向 量 。 分 类 
网 络 输出 为 2 维 向 量 , 分 别 表示 聚 类 属于 背景 和 行人 的 概率 ， 
两 者 的 和 为 1， 当 属于 行人 的 概率 大 于 0.6 时 ， 将 候选 聚 类 
判断 为 行人 。 回 归 网 络 会 回归 边界 框 的 位 置 以 及 朝向 ， 本 文 
按照 文献 [12] 的 方法 ， 将 其 分 为 中 心 坐 标 ， 旋 转角 度 以 及 标 
定 框 尺度 。 旋 转角 度 的 回归 分 解 为 旋转 区 间 的 判断 与 残 差 回 
归 。 因 此 ， 回 归 网 络 的 输出 为 G+X+N+3) 维 向 量 ， 其 中 
NN) 维 表示 旋转 区 间 的 概率 和 残 差 。 


回归 网 络 


图 4 识别 网 络 模型 


Fig.4 Point cloud recognition net model 
4 ”实验 结果 


4.1 样本 生成 

对 通过 筛选 之 后 得 到 的 候选 聚 类 ， 需 要 生成 样本 训练 聚 
类 识别 网 络 。 统 计 位 于 真 值 位 置 方 框 中 的 点 云 数目 ， 并 计算 
占 候选 聚 类 中 元 素 总 数 的 比例 ， 如 果 比 例 大 于 立 值 ， 则 认为 
候选 聚 类 为 正 样 本 , 即 为 行人 , 和 否则 认为 候选 聚 类 为 负 样 本 。 
本 文 在 实验 中 选择 的 阔 值 为 0.7。 
4.2 数据 集 介绍 

笔者 在 KITTI 数据 集 2129 上 进行 实验 , 并 评估 性 能 指标 。 
KITTI 数据 集 是 知名 的 自动 驾驶 数据 集 ， 包 含 双 目 图 像 、 激 
光 雷 达 数 据 以 及 IMU 数据 ， 可 以 对 包括 识别 ， 跟踪， 视觉 里 
程 计 , 光 流 以 及 分 割 等 多 种 任务 进行 性 能 指标 的 评价 。 KITTI 
数据 的 激光 雷达 为 Velodyne HDL-64E， 拥 有 64 根 扫描 线 ， 
最 大 感知 距离 为 120 m， 水 平 感知 范围 是 360"， 角 分 辩 率 为 
0.08"”， 垂 直 感 知 范围 为 26.9*， 角 分 辨 紊 大 约 0.4. OG TRA 
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安装 在 载 具 上 ， 高 度 大 约 为 1.73 m。 目 标 检测 的 数据 集中 含 
有 7481 张 训练 数据 以 及 7518 张 测试 数据 。 测 试用 例 分 为 简 
单 、 中 等 和 困难 三 个 等 级 ， 其 中 简单 用 例 为 边界 框 高 度 不 小 
于 40 个 像素 且 完 全 无 遮挡 的 目标 ,中 等 用 例 为 边界 框 高 度 不 
小 于 25 个 像素 且 部 分 被 遮挡 的 目标 , 困难 用 例 为 边界 框 高 度 
不 小 于 25 个 像素 且 大 部 分 被 遮挡 的 目标 。 

43 实验 结 
实验 使 用 的 计算 机 核心 处 理 器 为 17-4790K、 内 存 32 GB, 
主 频 3.1 GHz、 显 卡 为 GeForce GTX TITAN X、 显 存 12G， 
实现 工具 为 Tensorflow r1.4。 评 价 指 标 为 P-R 曲线 和 AP fü. 
P-R 曲线 的 横 坐 标 为 recall， 纵 坐标 为 precision, AP 值 则 是 
P-R 曲线 下 的 面积 。 


TP 
recision — 7 
p TP+FN 0) 
éd. 0 (8) 

TP4 FP 


其 中 : TP ”预测 结果 中 的 真 阳 性 数 ，FN 为 预测 结果 中 的 假 阴 
性 数 ，FP 为 预测 结果 中 的 假 阳 性 数 。 
图 5 为 本 文 提出 的 算法 与 文献 [13,14] 结 果 的 P-R 曲线 比 
较 ， 从 左 到 右 分 别 为 简单 、 中 等 和 困难 用 例 的 结果 。 其 中 ， 


蓝 色 曲线 为 本 文 提 出 算法 的 P-R 曲线 ， 红 色 和 黄色 分 别 为 
BirdNet03 和 TopNetL4 的 结果 ， 可 以 看 出 本 文 提出 的 算法 在 
处 理 不 同 难度 的 用 例 时 , 性 能 均 大 幅 优 于 BirdNet 和 TopNet。 
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(c)Hard 
图 5 简单 、 中 等 及 困难 测试 用 例 的 P-R 曲线 
Fig.5 P-R curves belongs to easy, moderate and hard examples 

表 1 中 为 本 文 提 出 的 算法 与 BirdNet 及 TopNet 在 KITTI 
数据 集 的 评测 结果 。 可 以 看 到 , 对 于 简单 及 中 等 的 测试 用 例 ， 
本 文 提 出 的 算法 的 AP 值 高 于 BirdNet 及 TopNet 的 结果 20 
以 上 ， 而 对 于 困难 测试 用 例 ， 本 文 提出 的 算法 AP 值 高 于 其 
他 两 种 方法 10 以 上 。 这 充分 说 明了 本 文 提出 的 算法 在 行人 检 
测 的 任务 中 优秀 性 能 。 


5 ”结束 语 


本 文 提 出 了 结合 传统 激光 雷达 运动 目标 检测 和 点 云 分 类 
的 行人 检测 算法 ， 仅 利用 激光 雷达 数据 ， 可 以 直接 获取 检测 
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目标 的 深度 。 算 法 首先 通过 地 面 去 除 分 离 地面 和 目标 ， 接 着 
通过 聚 类 算法 获取 目标 聚 类 ， 然 后 将 聚 类 输入 到 训练 好 的 深 
度 神经 网 络 中 ， 获 得 聚 类 的 类 别 及 位 置 。 本 文 提 出 的 算法 能 
够 在 KITTI 数据 集 上 获取 良好 的 结果 ， 人 性 能 超过 了 其 他 仅 利 
用 激光 雷达 数据 的 行人 检测 算法 。 


表 1 本 文 算法 在 KITTI 数据 集 上 的 性 能 /% 
Table 1 Proposed method performance on KITTI dataset /96 
算法 人 
easy medium hard 
本 文 算法 40.19 33.37 27.90 
BirdNet!?! 14.31 11.80 10.55 
TopNet!!^! 11.46 10.95 9.09 
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